期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 一种基于循环神经网络的古文断句方法
王博立, 史晓东, 苏劲松
北京大学学报自然科学版    2017, 53 (2): 255-261.   DOI: 10.13209/j.0479-8023.2017.032
摘要1394)   HTML19)    PDF(pc) (2307KB)(453)    收藏

提出一种基于循环神经网络的古文自动断句方法。该方法采用基于GRU (gated recurrent unit)的双向循环神经网络进行古文断句。在解码过程中, 该算法不仅利用神经网络输出的概率分布, 还进一步引入状态转移概率和长度惩罚, 以便提高断句准确率。在大规模古籍语料上的实验结果表明, 所提方法能够取得比传统方法更高的断句F1值。

图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
2. 古典诗词动画自动生成研究
阎思瑶,郑旭玲,史晓东,郑发魁
北京大学学报(自然科学版)   
摘要957)      PDF(pc) (1608KB)(277)    收藏
以中国古典诗词为研究对象, 首次尝试将自然语言处理、计算诗学和计算机动画等相关研究成果相结合来解决古典诗词的动画自动生成。首先使用基于SVM和协同学习的分类器对古诗风格、题材以及时间进行自动判定。随后在使用Flash Actionscript 3.0脚本实现动画自动生成的基础上, 利用共现关系对生成的动画进行动画元件的补充, 并提出古诗场景划分方法。实验表明, 提出的方法初步解决了古典诗词的动画自动生成问题, 也为后继的相关研究提供了理论依据和实验基础。
相关文章 | 多维度评价 | 评论0
3. 语料库语言学视角下的台湾汉字简化研究
王博立,史晓东,陈毅东,任文瑶,阎思瑶
北京大学学报(自然科学版)   
4. 基于话题分布相似度的无监督评论词消歧方法
郭瑛媚,史晓东,陈毅东,高燕
北京大学学报(自然科学版)   
摘要643)      PDF(pc) (530KB)(253)    收藏
基于话题信息、词的位置关系和互信息等特征, 提出一种无监督的跨语言词义消歧算法。该算法仅利用在线词典和web搜索引擎, 通过上下文信息选择评论句中多义评论词的词义。实验结果表明, 所提出的词义消歧算法具有较高准确率, 对于具有较多候选词义的评论词仍能表现出较好的性能。
相关文章 | 多维度评价 | 评论0